秒杀AlphaFold!Science:用AI一秒设计自然界全新蛋白质
【新智元导读】利用AI,我们现在可以在几秒之内设计出自然界中全新的蛋白质了。最近,来自华盛顿大学的科学家在Science上连发两篇论文,介绍了ProteinMPNN算法工具。
而现在,人工智能又在蛋白质设计领域引发了新一轮革命。
生物学家发现,使用机器学习,可以在几秒钟内创建出蛋白质分子。而在以前,这个时间也许是几个月。
并且,新方法准确率也更高。
9月15日,华盛顿大学医学院的生物学家在Science上连发两篇论文,介绍了他们的重大发现。
论文地址:https://www.science.org/doi/10.1126/science.add2187
也许你会问:创造出自然界中没有的蛋白质,对我们有什么意义?
意义可太大了。通过这些蛋白质,也许我们会开发出更多疫苗,加快治疗癌症的研究,研发出碳捕获工具,和全新的可持续生物材料。
论文地址:https://www.science.org/doi/10.1126/science.add1964
ProteinMPNN:蛋白质设计的革命
这几年,已经有几十种人工智能蛋白质设计工具被开发了出来,研究人员可以混合和匹配各种方法来得出一个可行的最终设计。
下面,我们就简单介绍一下其中的4种方法:
固定骨架设计
给定一个预设蛋白质结构,然后用Al确定该蛋白质的氨基酸序列。
序列生成
利用语言模型,让AI学会如何生成蛋白质。然后通过微调这些神经网络,得到特定蛋白质家族成员的新序列。
结构生成
对蛋白质结构进行训练的神经网络可以生成完全新颖的蛋白质结构,但往往对输出的控制有限。
序列和结构设计
使用一种叫做inpainting的方法,研究人员输入他们希望包含在蛋白质中的结构或序列,而Al网络则填补其余部分。
在这两篇新论文中,华盛顿大学医学院的生物学家表示,机器学习可用于比以前更准确、更快速地创建蛋白质分子。
David Baker是华盛顿大学医学院生物化学教授、2021年生命科学突破奖获得者。
据他介绍:「蛋白质是整个生物学的基础,但是要知道,现在我们在每种植物、动物和微生物中发现的所有蛋白质,都还不到所有可能的蛋白质的百分之一。有了这些新的软件工具,研究人员也许就能够找到长期的解决方案,去攻克医学、能源和技术上的难题。」
在自然界中,蛋白质被称为「生命的基石」,因为它们在所有生物的结构中都是必不可少的。在一个细胞生长、分裂、修复的每一个过程中,几乎都有蛋白质的参与。
可以说,蛋白质基本解决了生命的所有问题,生物学中的一切都发生在蛋白质上。
Baker介绍说:「为了解决生物体在进化过程中面临的问题,它们在进化中不断演变。人类今天在面临着新的问题,比如新冠病毒。如果我们能设计出一种新的蛋白质,让它像在进化过程中演变出的蛋白质一样,解决种种问题,那它的力量将是非常强大的。」
在生物的数百万年进化中,蛋白质的演化痕迹使科学家能够快速破译数百种蛋白质的3D形状
蛋白质由数十万个氨基酸组成,这些氨基酸以长链的形式连接起来。蛋白质中的氨基酸序列决定了它的三维形状。这种复杂的形状对于蛋白质的功能至关重要。
在2020年,人工智能实验室DeepMind宣布AlphaFold时,就已经让全世界大吃一惊了。这个AI工具利用深度学习,解决了生物学的一个大挑战:准确预测蛋白质的形状。而今年夏天,DeepMind宣布,AlphaFold现在可以预测科学上已知的所有蛋白质的形状。
通过预测蛋白质的结构,就可以洞察它们的表现。
在蛋白质预测领域,科学家已经取得了举世瞩目的惊人成绩。而在蛋白质设计领域, Baker的团队也取得了突破性进展。
使用ProteinMPNN设计的蛋白质的细节
要知道,按照一般的传统,研究人员设计蛋白质时,是通过调整自然界中已知的蛋白质。但是ProteinMPNN的出现,可以让研究人员从头设计所有可能的蛋白质,这就打开了一个新世界。
ProteinMPNN帮助研究人员解决了逆向的问题——如果他们心中已经有了一个确切的蛋白质结构,它就能帮助他们找到能折叠成这个形状的氨基酸序列。ProteinMPNN使用的的是一个在很多折叠成三维结构的氨基酸序列中训练出来的神经网络。
蛋白质设计的三个挑战
Baker的团队将蛋白质设计的挑战分解为三个部分,并且针对每个部分,都设计了特定的软件方案。
意义重大
作者介绍
David Baker博士是华盛顿大学基因组科学、生物工程、化学工程、计算机科学和物理学的副教授。他的研究小组专注于大分子结构和功能的设计。
https://www.science.org/doi/10.1126/science.add2187
--------- End ---------
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或
姓名-学校-职务/研究方向。
- 历史文章推荐 -
【蛋白质结构与AlphaFold】
●Nature评论|AlphaFold如何在结构生物学中实现AI的全部潜力
●AlphaFold预测出2亿种蛋白质结构,打开整个蛋白质宇宙
●分子之心发力!业界首个功能完整的AI蛋白设计平台MoleculeOS首次公开
●Nat Mach Intel|用语言模型进行可控的蛋白质设计
●Commun Biol|人工智能指导下的内在无序蛋白质的构象挖掘
●Nat Methods|ScanNet:基于结构的蛋白质结合位点预测深度学习模型
●Nat Methods|ColabFold:让所有人都能进行蛋白质折叠
●Nat Rev Mol Cell Bio|用人工智能预测蛋白质结构的前景和机遇
●Nat Commun|使用AlphaFold2改进对蛋白质-蛋白质相互作用的预测
●Nat Commun|在生物科学领域应用深度学习的当前进展和开放挑战
●Facebook|从数百万个预测蛋白质结构中学习逆折叠,预测序列信息
●AI+蛋白质错误折叠疾病的药物开发|Congruence获5000万美元A轮融资
●BIB|通过深度多任务学习准确预测RNA、DNA 和蛋白质结合的内在无序残基
●Curr Opin Struc Biol|蛋白质设计的深度生成建模
●Nat Methods|用AlphaFold以原子精度预测蛋白质结构
●Drug Discov Today|基于AI的蛋白质结构数据库有可能加速罕见病研究
●Nat Methods特刊|2021年度方法:蛋白质结构预测
●Nature Outlook|借助算法和模拟将蛋白质折叠的瞬时结构转变为药物靶点